定义
同方差意为方差具有相同的分布,或者说相同的方差。
$E(u_i^2)=\sigma^2,i=1,2,…,n$
不管变量$X_i$取什么值,$Y_i$的条件方差都保持不变。
异方差表明$Y_i$的方差不再保持不变,会随着$X_i$的变化而变化,符号上记为:
$E(u_i^2)=\sigma_i^2,i=1,2,…,n$
OLS估计
记双变量模型为:$Y_i=\beta_1+\beta_2X_i+u_i$,按照惯常的估计有
现在它的方差是:
当$\sigma_i^2=\sigma^2$时,就回到熟悉的OLS估计量方差表达式了。容易证明,在异方差情况下,$\hat{\beta}_2$仍是线性和无偏的,是一致估计量,即随着样本容量无限增大,$\hat{\beta}_2$收敛于其真值;在正则性条件下还可以证明其为渐近正态分布。
GLS
将原始变量转换为满足经典模型假设的转换变量,然后对它们使用OLS程序,叫做广义最小二乘法(GLS)。
现在假定不同的方差$\sigma_i^2$已知,对双变量方程两边除以$\sigma_i^2$得:
可以看到转换后的误差项具有同方差,对这样的方程用OLS估计可以得到满意的结果。
OLS和GLS的区别
OLS要求我们最小化残差平方和:
而在GLS中,要求我们最小化:
可以看到,GLS相当于利用加权的思想最小化原来OLS模型中的残差平方和,GLS分配给每一条观测的权重与其方差$\sigma_i^2$成反比。所以由此得到的估计量又叫WLS(加权最小二乘)估计量,属于GLS估计中的一种特殊情形。
异方差侦察
图解法
将OLS估计的残差对解释变量和被解释变量描图,观察残差是否和某个变量有某种规律。
等级相关检验
在Park检验和Glejser检验中,要观察残差和某个变量$X_i$是否存在函数(可能是非线性关系)关系,会对残差和解释变量$X_i$做各种形式上的变换,然后进行回归,如果回归系数显著,可以认为存在异方差。
斯皮尔曼等级相关系数记为:
其中$d_i$为第$i$条观测中两个变量的等级(秩)之差,$n$为样本容量。详细步骤如下:Step1
对$Y$和$X$做回归,得到残差$\hat{u}_i$Step2
将残差绝对值$|\hat{u}_i|$和$X_i$或$\hat{Y_i}$同时计算各自所在数据中的秩(等级),然后计算按上式得到斯皮尔曼等级相关系数。Step3
在总体等级相关系数$\rho_s$为0且$n>8$的情况下,样本$r_s$的显著性可以通过$t$检验完成
如果计算的$t$值超过$t$分布临界值就接受异方差的假设,如回归模型设计多于1个的$X$变量,则可分别计算$r_s$做统计显著性检验。
戈德菲尔德-匡特检验
假设$\sigma_i^2$与$X$有正向关系:$\sigma_i^2=\sigma^2X_i$,则可以对数据分组,比较不同组别的方差是否相同。步骤如下:Step1
从最小的$X$值开始,对观测进行排序Step2
略去中间的$c$个观测值,其中$c$是预定的,并将其余$n-c$个观测值分为两组,每组$(n-c)/2$个Step3
对两组数据各自拟合一个回归,得到残差平方和$RSS_1$和$RSS_2$,这两个残差平方和的自由度都是$(n-c)/2-k$,可以在$u_i$服从正态分布的条件下,构造$F$统计量:
为了突出或激化小方差组和大方差组之间的差异,选好$c$是很关键的,但没有一个明文规定的$c$可供选择,另外这种检验依赖于$\sigma_i^2$与$X$有正向关系。
BPG检验
考虑$k$变量回归模型:
假定真实的方差满足:
其中$Z$是部分或者全部的$X$变量($m\leq k$),如果$\alpha_2=\alpha_3=…=\alpha_m=0$,则$\sigma_i^2=\alpha_1$,即同方差。所以可以通过将残差和各个变量做回归,通过检验系数的显著性来判断异方差的存在。步骤如下:Step1
用OLS估计得到残差$\hat{u}_i$Step2
计算$\tilde{\sigma}^2=\sum \hat{u}_i^2/n$,这是$\sigma^2$的极大似然估计Step3
构造$p_i=\hat{u}_i^2/\tilde{\sigma}^2$Step4
构造回归$p_i=\alpha_1+\alpha_2Z_{2i}+…+\alpha_mZ_{mi}+v_i$,$v_i$是回归的残差项Step5
假定$u_i$服从正态分布,那么在同方差的原假设下,回归解释平方和$ESS$满足$\frac{1}{2}ESS\sim\chi ^2_{m-1}\ asy$
BPG检验实际是一种渐进性或者说大样本检验,容易受干扰项偏离正态性假定的影响。当样本趋于无穷大时,这个检验才是可靠的。
怀特异方差检验
Step1
用OLS估计$Y_i=\beta_1+\beta_2X_{2i}+\beta_3X_{3i}+u_i$得到残差$\hat{u}_i$Step2
对变量$X$的原始回归元、平方项和交叉项做辅助回归
Step3
辅助回归的$R^2$和样本容量$n$渐近服从$\chi^2(df)$,$df$为辅助回归里面的回归元个数(不含截距项)
- 引入模型的回归元和平方项、交叉项会迅速消耗自由度,使得估计结果不可靠
- 不引入交叉项,是对纯粹异方差的检验
- 引入交叉项既是对异方差的检验,也是对设定偏误的检验